Cơ sở lý thuyết Đồng_bộ_hóa_dữ_liệu

Một số mô hình thuyết về đồng bộ hóa dữ liệu đã được công bố trong một số nghiên cứu khoa học, và vấn đề cơ bản của việc đồng bộ hóa liên quan đến bài toán mã hóa Slepian-Wolf của ngành lý thuyết thông tin. Các mô hình lý thuyết này được phân loại tùy theo việc chúng xem xét dữ liệu được đồng bộ hóa như thế nào.

Dữ liệu không có thứ tự

Bài toán đồng bộ hóa dữ liệu không có thứ tự (còn gọi là bài toán hòa hợp tập hợp - set reconciliation problem) được mô hình hóa thành cách tính mức chênh lệch đối xứng S A ⊕ S B = ( S A − S B ) ∪ ( S B − S A ) {\displaystyle S_{A}\oplus S_{B}=(S_{A}-S_{B})\cup (S_{B}-S_{A})} giữa hai tập xa nhau S A {\displaystyle S_{A}} và S B {\displaystyle S_{B}} các số b {\displaystyle b} -bit.[1] Một số cách xử lý tiêu biểu là:

Chuyển toàn bộ (wholesale transfer)Trong trường hợp này toàn bộ dữ liệu được truyền tới một nơi để tiến hành so sánh cục bộ.Đồng bộ hóa theo dấu thời gian (timestamp synchronization)Trong trường hợp này mọi thay đổi đối với các dữ liệu được đánh dấu bằng các dấu thời gian (timestamp). Việc đồng bộ hóa được tiến hành bằng cách chép các dữ liệu có dấu thời gian mới nhất so với lần đồng bộ hóa trước đó.[2]Đồng bộ hóa kiểu toán học (mathematical synchronization)Trong trường hợp này dữ liệu được xem như những đối tượng toán học và đồng bộ hóa tương ứng với một quá trình xử lý toán học.[1][3][4]

Dữ liệu được xếp thứ tự

Trong trường hợp này, hai chuỗi xa nhau σ A {\displaystyle \sigma _{A}} và σ B {\displaystyle \sigma _{B}} cần được hòa hợp với nhau. Thông thường, các chuỗi này được giả định là khác nhau tới một số cố định các sửa đổi nào đó (tức là các thao tác thêm, xóa, sửa các ký tự). Sau đó quá trình đồng bộ hóa dữ liệu là việc giảm dần khoảng cách sửa đổi giữa σ A {\displaystyle \sigma _{A}} và σ B {\displaystyle \sigma _{B}} , cho đến khi khoảng cách sửa đổi bằng không. Một số hướng đi cho vấn đề này có thể kể đến:

  1. Microsoft Sync Framework
  2. rsync
  3. tách chuỗi (shingling) - tách các chuỗi thành các chuỗi con để đưa bài toán này về bài toán đồng bộ hóa dữ liệu không theo thứ tự.[5]

Tài liệu tham khảo

WikiPedia: Đồng_bộ_hóa_dữ_liệu http://www.microsoft.com/downloads/Browse.aspx?dis... http://www.pumatech.com/enterprise/wp-1.html http://www.thongtincongnghe.com/article/4889 http://ipsit.bu.edu/documents/puzzles_journal.pdf http://people.bu.edu/staro/infocom02pda.pdf //doi.org/10.1109%2FINFCOM.2002.1019402 //doi.org/10.1109%2FTIT.2003.815784 //doi.org/10.1109%2FTPDS.2006.148 http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumb... //www.worldcat.org/issn/0018-9448